5.4.3 Cluster- og robust-estimering
Opsjonene robust og cluster() brukes hver for seg til å spesifisere om en ønsker hhv. robust- eller cluster-estimering, og vil som resultat presentere regresjonsestimater med justerte standardavvik for de estimerte koeffisienter. Også tilhørende t-, z- og p-verdier påvirkes. Øvrige verdier påvirkes ikke sammenliknet med standard estimering.
Merk at robust og cluster ikke kan benyttes i kombinasjon (cluster impliserer robust estimering).
Robust estimering kan brukes der det er mistanke om problematiske "outliers" eller heteroskedastisitet.
Cluster-estimering brukes når en mistenker at det er systematiske avhengigheter innen grupper av observasjoner, f.eks. innen skoler eller
kommuner. Gruppene spesifiseres gjennom en variabel (cluster-variabel) som inngår i parentesen til cluster-opsjonen, f.eks. cluster(skole)
eller cluster(kommune). Følgende forutsetninger gjelder, hvis ikke vil systemet gi en feilmelding:
-
Antallet grupper må være av en viss størrelse
-
Clustervariabelen må være numerisk
-
Clustervariabelen kan ikke inngå som variabel i regresjonsuttrykket
Eksempler:
regress inntekt mann gift høy_utdanning, robust
regress inntekt mann gift høy_utdanning, cluster(kommune)
Robust- og cluster-opsjoner kan benyttes også på øvrige regresjonstyper.